智能论文笔记

Variable importance without impossible data

Masayoshi Mase , Art B. Owen , Benjamin B. Seiler

分类：机器学习 | 人工智能 | (统计)机器学习

2022-05-31

测量黑匣子预测算法中变量重要性的最流行方法是利用合成输入，这些输入结合了来自多个受试者的预测变量。这些输入可能是不可能的，身体上不可能的，甚至在逻辑上是不可能的。结果，对这种情况的预测可以基于数据，这与对黑匣子的训练非常不同。我们认为，当解释使用此类值时，用户不能相信预测算法的决定的解释。取而代之的是，我们主张一种称为同类沙普利的方法，该方法基于经济游戏理论，与大多数其他游戏理论方法不同，它仅使用实际观察到的数据来量化可变重要性。莎普利队的同伙通过缩小判断的主题的缩小，被认为与一个或多个功能上的目标主题相似。如果使用它来缩小队列对队列平均值有很大的不同，则功能很重要。我们在算法公平问题上进行了说明，其中必须将重要性归因于未经训练模型的保护变量。对于每个主题和每个预测变量，我们可以计算该预测因子对受试者的预测响应或对其实际响应的重要性。这些值可以汇总，例如在所有黑色受试者上，我们提出了一个贝叶斯引导程序来量化个人和骨料莎普利值的不确定性。

translated by 谷歌翻译

Accurate and fast identification of minimally prepared bacteria phenotypes using Raman spectroscopy assisted by machine learning

Benjamin Lundquist Thomsen , Jesper B. Christensen , Olga Rodenko , Iskander Usenov , Rasmus Birkholm Grønnemose , Thomas Emil Andersen , Mikael Lassen

分类：机器学习

2022-06-27

全球抗菌耐药性（AMR）的增加是对人类健康的严重威胁。为了避免AMR的传播，快速可靠的诊断工具可以促进最佳的抗生素管理。在这方面，拉曼光谱学有望在一步中快速标记和无培养物鉴定以及抗菌敏感性测试（AST）。但是，尽管许多基于拉曼的细菌识别和AST研究表现出了令人印象深刻的结果，但仍必须解决一些缺点。为了弥合概念验证研究和临床应用之间的差距，我们与新的数据增强算法相结合开发了机器学习技术，以快速鉴定最小制备的细菌表型和甲氧西林抗甲氧西林（MR）的区别（MR）的区别甲氧西林敏感（MS）细菌。为此，我们为细菌的超光谱拉曼图像实施了光谱变压器模型。我们表明，我们的模型在精度和训练时间方面都超过了许多分类问题的标准卷积神经网络模型。对于六种MR-MS细菌物种，我们在数据集中达到了超过96美元的分类精度，该数据集由15个不同类别和95.6 $ \％$分类精度。更重要的是，我们的结果仅使用快速，易于生产的培训和测试数据获得

translated by 谷歌翻译

SyntheX: Scaling Up Learning-based X-ray Image Analysis Through In Silico Experiments

Cong Gao , Benjamin D. Killeen , Yicheng Hu , Robert B. Grupp , Russell H. Taylor , Mehran Armand , Mathias Unberath

分类：计算机视觉 | 机器学习

2022-06-13

现在，人工智能（AI）可以自动解释医学图像以供临床使用。但是，AI在介入图像中的潜在用途（相对于参与分类或诊断的图像），例如在手术期间的指导，在很大程度上尚未开发。这是因为目前，使用现场分析对现场手术收集的数据进行了事后分析，这是因为手术AI系统具有基本和实际限制，包括道德考虑，费用，可扩展性，数据完整性以及缺乏地面真相。在这里，我们证明从人类模型中创建逼真的模拟图像是可行的替代方法，并与大规模的原位数据收集进行了补充。我们表明，对现实合成数据的训练AI图像分析模型，结合当代域的概括或适应技术，导致在实际数据上的模型与在精确匹配的真实数据训练集中训练的模型相当地执行的模型。由于从基于人类的模型尺度的合成生成培训数据，因此我们发现我们称为X射线图像分析的模型传输范式（我们称为Syntheex）甚至可以超越实际数据训练的模型，因为训练的有效性较大的数据集。我们证明了合成在三个临床任务上的潜力：髋关节图像分析，手术机器人工具检测和COVID-19肺病变分割。 Synthex提供了一个机会，可以极大地加速基于X射线药物的智能系统的概念，设计和评估。此外，模拟图像环境还提供了测试新颖仪器，设计互补手术方法的机会，并设想了改善结果，节省时间或减轻人为错误的新技术，从实时人类数据收集的道德和实际考虑方面摆脱了人为错误。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

Carbon Footprint of Selecting and Training Deep Learning Models for Medical Image Analysis

Raghavendra Selvan , Nikhil Bhagwat , Lasse F. Wolff Anthony , Benjamin Kanding , Erik B. Dam

分类：计算机视觉 | 机器学习

2022-03-04

由于不断增长的计算要求，深度学习（DL）的能源消耗和碳足迹的增加已成为引起人们关注的原因。在这项工作中，我们关注开发医学图像分析模型（MIA）的碳足迹，其中处理了高空间分辨率的体积图像。在这项研究中，我们介绍并比较了文献中四种工具的特征，以量化DL的碳足迹。使用这些工具之一，我们估计了医学图像分割管道的碳足迹。我们选择NNU-NET作为医疗图像分割管道的代理，并在三个常见数据集上进行实验。在我们的工作中，我们希望告知MIA产生的能源成本不断增加。我们讨论了削减环境影响的简单策略，以使模型选择和培训过程更加有效。

translated by 谷歌翻译

Learning from learning machines: a new generation of AI technology to meet the needs of science

Luca Pion-Tonachini , Kristofer Bouchard , Hector Garcia Martin , Sean Peisert , W. Bradley Holtz , Anil Aswani , Dipankar Dwivedi , Haruko Wainwright , Ghanshyam Pilania , Benjamin Nachman

分类：机器学习 | 人工智能

2021-11-27

我们概述了新兴机会和挑战，以提高AI对科学发现的效用。AI为行业的独特目标与AI科学的目标创造了识别模式中的识别模式与来自数据的发现模式之间的紧张。如果我们解决了与域驱动的科学模型和数据驱动的AI学习机之间的“弥补差距”相关的根本挑战，那么我们预计这些AI模型可以改变假说发电，科学发现和科学过程本身。

translated by 谷歌翻译

Fully-automated patient-level malaria assessment on field-prepared thin blood film microscopy images, including Supplementary Information

Charles B. Delahunt , Mayoore S. Jaiswal , Matthew P. Horning , Samantha Janko , Clay M. Thompson , Sourabh Kulhare , Liming Hu , Travis Ostbye , Grace Yun , Roman Gebrehiwot

分类：机器学习 | (统计)机器学习

2019-08-05

疟疾是一种威胁生命的疾病，影响了数百万。基于显微镜的薄膜评估是（i）确定疟疾物种和（ii）定量高寄生虫感染的标准方法。通过机器学习（ML）对疟疾显微镜的完全自动化是一项具有挑战性的任务，因为预先准备的滑动在质量和表现方面差异很大，并且伪像通常超过相对较少的寄生虫。在这项工作中，我们描述了一个用于薄膜疟疾分析的完整，完全自动化的框架，该框架应用了ML方法，包括卷积神经网（CNN），该方法在大型且多样化的田间预先准备的薄膜数据集中进行了训练。定量和物种鉴定结果几乎足够准确地满足了耐药性监测和临床用例的混凝土需求。我们将方法和性能指标集中在现场用例要求上。我们讨论了将ML方法应用于疟疾显微镜的关键问题和重要指标。

translated by 谷歌翻译

PennyLane: Automatic differentiation of hybrid quantum-classical computations

Ville Bergholm , Josh Izaac , Maria Schuld , Christian Gogolin , Shahnawaz Ahmed , Vishnu Ajith , M. Sohaib Alam , Guillermo Alonso-Linaje , B. AkashNarayanan , Ali Asadi

分类：机器学习

2018-11-12

Pennylane是用于量子计算机可区分编程的Python 3软件框架。该库为近期量子计算设备提供了统一的体系结构，支持量子和连续变化的范例。 Pennylane的核心特征是能够以与经典技术（例如反向传播）兼容的方式来计算变异量子电路的梯度。因此，Pennylane扩展了在优化和机器学习中常见的自动分化算法，以包括量子和混合计算。插件系统使该框架与任何基于门的量子模拟器或硬件兼容。我们为硬件提供商提供插件，包括Xanadu Cloud，Amazon Braket和IBM Quantum，允许Pennylane优化在公开访问的量子设备上运行。在古典方面，Pennylane与加速的机器学习库（例如Tensorflow，Pytorch，Jax和Autograd）接口。 Pennylane可用于优化变分的量子本素体，量子近似优化，量子机学习模型和许多其他应用。

translated by 谷歌翻译

Conservation Tools: The Next Generation of Engineering--Biology Collaborations

Andrew Schulz , Cassie Shriver , Suzanne Stathatos , Benjamin Seleb , Emily Weigel , Young-Hui Chang , M. Saad Bhamla , David Hu , Joseph R. Mendelson III , .

分类：机器学习

2023-01-03

The recent increase in public and academic interest in preserving biodiversity has led to the growth of the field of conservation technology. This field involves designing and constructing tools that utilize technology to aid in the conservation of wildlife. In this article, we will use case studies to demonstrate the importance of designing conservation tools with human-wildlife interaction in mind and provide a framework for creating successful tools. These case studies include a range of complexities, from simple cat collars to machine learning and game theory methodologies. Our goal is to introduce and inform current and future researchers in the field of conservation technology and provide references for educating the next generation of conservation technologists. Conservation technology not only has the potential to benefit biodiversity but also has broader impacts on fields such as sustainability and environmental protection. By using innovative technologies to address conservation challenges, we can find more effective and efficient solutions to protect and preserve our planet's resources.

translated by 谷歌翻译

STEPs: Self-Supervised Key Step Extraction from Unlabeled Procedural Videos

Anshul Shah , Benjamin Lundell , Harpreet Sawhney , Rama Chellappa

分类：计算机视觉

2023-01-02

We address the problem of extracting key steps from unlabeled procedural videos, motivated by the potential of Augmented Reality (AR) headsets to revolutionize job training and performance. We decompose the problem into two steps: representation learning and key steps extraction. We employ self-supervised representation learning via a training strategy that adapts off-the-shelf video features using a temporal module. Training implements self-supervised learning losses involving multiple cues such as appearance, motion and pose trajectories extracted from videos to learn generalizable representations. Our method extracts key steps via a tunable algorithm that clusters the representations extracted from procedural videos. We quantitatively evaluate our approach with key step localization and also demonstrate the effectiveness of the extracted representations on related downstream tasks like phase classification. Qualitative results demonstrate that the extracted key steps are meaningful to succinctly represent the procedural tasks.

translated by 谷歌翻译